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Metoder for sekvensanalyse 



Foreliggende oppfinnelse er utskilt fra patentS0knad 19986133 som omfatter en metode 
for DNA-sekvensering som inneholder fialgende trinn: 

Fenrste trinn tar utgangspunkt i en ren DNA-populasjon bestSende av DNA-sekvensen 
som skal sekvenseres. DNA-molekylene kuttes/brekkes pk en uspesifikk mite slik at det 
dannes en populasjon med DNA-molekyler best&ende av biter (heretter kalt DNA-biter) 
av den opprinnelige sekvensen. 

Annet trinn bestar i a erstatte baseparene i DNA-bitene med 4 ulike DNA-sekvenser 
(heretter kalt DNA-fragmenter) som representerer hver av de fire basene adenin, cyto- 
sin, guanin og tymin. Der hvor det har vaert basepar A-T, settes det altsi inn "fragment 
A", C-G byttes ut med "fragment C" osv. Dermed genereres nye DNA-molekyler hvor 
den opprinnelige baserekkefSertgen pa f.eks. ACGTT... erstattes med fragment A - 
fragment C - fragment G osv. Lengden pk disse fire DNA-fragmentene kan i prinsippet 
variere i lengde fra 2bp til flere hundre kbp (eller mer om 0nskelig), alt etter behov. 
Tilsvarende kan DNA-fragmentene inneholde reportergener og annen biologisk infor- 
masjon eller kun besta av sekvenser uten kjent biologisk ftmksjon. 

I tredje trinn avleses rekkefolgen av de fire typene DNA-fragmenter for hvert enkelt 
DNA-molekyl. Dermed finner man baserekkefolgen i de opprinnelige DNA-bitene 
indirekte. 

I fierde trinn benytter et dataprogram overlappen mellom DNA-bitene til a sette sammen 
informasjonen fra trinn 3 til sekvensen pa DNA-sekvensene som ble brukt som utgangs- 
punkt. 

Foreliggende oppfinnelse omhandler alternative mater for utfiafrelsen av trinn 2 og 3; 
hvor konverteringen og avlesningen utf0res pa det samme underlaget. 



Alternative konverteringsmekanismer pa fast matrix 



avlesningsmekaSismene. Det er imidlertid ogsa mulig a la konverteringen og aylesningen forega 
pa det samme underlaget. Nedenfor Mger eksempler pi slike prosedyren Et viktig poeng med 
disse prosedyrene er at man i tillegg til a fi basesammensetningen ay korte omrader (10-100bp, 
eller mer) ogsa far irdbrrr*^ 

fopptil flere kb). Dette er av betydning for rekonstruksjonen i trinn4 og metoden kan f.eks. brakes 
til T komplementere sekvensinformasjon som er utledet vha de tidligere omtalte alternatives. 

Alternativl .._ 

Utgangspunktet for denne prosedyren er en PCR-reaksjon hvor man amphfiserer opp DNA- 
sekveien som skal sekvenseres. Den ene primeren er biotinmerket i den ene enden slik at man 
kan feste DNA-molekylene til et streptavidinunderlag. Streptavidinen er arrangert i en tynn hnje 
slik at DNA-molekylene er festet ved siden av hverandre pa en rekke. Deretter behandles DNA- 
molekylene slik som illustrert i fig. 1 . . . 

Et viktig poeng med avlesningsmetoden er at adapternes relative posisjoner vanerer med 
den relative posisjonen til sekvensen som gjenkjennes. Dermed blir det lettere i rekonstxuere 
sekvensen i siste trinn. Pi figur 1 ser man f.eks at adapteren ACG befinner seg iengst til venstre 
mens adapteren GCT lengst til hoyre, noe som gjenspeiler disse sekvensenes innbyrdes 
posisjoner pa polynukleotidet. Hvis man regner med en fluorescenshalo pa omlag lOOnm og at 
lOOnm utstrukket DNA tUsvarer omtrent 40-50 bp betyr det at man sannsynligvis vil klare a 
plassere hver adapter med en presisjon pa 10-50bp. 

Videre ma det poengteres at sekvensinformasjonen som avleses per DNA-molekyl kan 
gi 0 res langt st0rre enn 3 bp som i figurl. Ved a anvende konverteringsmetodene som jeg har 
beskrevet i den opprinnelige patents0knaden av 23/12-98 samt ettersendte revisjoner, fer DNA- 
molekylene festes til streptavidinunderlaget kan man sannsynligvis fa sekvensinformasjon som 
tilsvarer 50 bp eller mer per DNA-molekyl som konverteres. Det er ogsa mulig a bruke 
konverteringsmekanismen illustrert i fig.2. 

Til slu'tt ma det understrekes at avlesningspotensialet kan 0kes ved a avlese flere ulike 
DNA-sekvenser pa samme avlesningsplate (fig.3). F.eks. kan man vha PCR amphfisere opp et 
storre antall gener med genspesifikke primere. Deretter lager man unike overheng pa de 
oppamplifiserte gensekvensene. Det kan f.eks. gjenres ved a bruke ekstra lange primere i siste 
svklus eller legge inn kuttester for restriksjons endonukleaser som kutter sjeldent, mm. Dermed 
kan man hybridisere genene til en DNA-chips hvor hvert kvadrat bestir av oligonukleotider som 
er spesifikke for de ulike genene. DNA-molekylene som tilsvarer GenA vil dermed hybnd 1S eres 
til kvadratA GenB til kvadratB, osv. Denne metoden er saerlig egnet til massescreemng av 
enkeltpersoners genomer da man har muligheten til a plukke ut de spesifikke omradene av et 
genom som er av f.eks. medisinsk interesse. 
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Fig.l Prinsippet bak alternative For a illustrerere prinsippet er det her vist sekvenseringen av et ni basepar langt 
polynukleotid, ACGTGAGCT. I virkelighetenvil vil det vaere aktuelt a sekvensere mye lengre DNA-molekyler 
(opptil flere kb eller lengre). Etter at polynukleotidet er amplifisert opp og festet til et underlag pa en rett linje 
behandles DNA-molekylene med Dnasel eller lignende slik at de kuttes tilfeldig (trinn I)) . I trinn 2) ligeres de 
kuttede endene med et polynukleotid som inneholder et bindingssete for en klassell restriksjons endonuklease som 
kutter utenfor sitt eget bindingssete (I dette tilfellet Earl). Nar man tilsetter restriksjons endonukleasen i trinn 3) 
dannes det dermed overheng i polynukleotidene. I trinn 4) tilsettes adaptere som gjenkjenner og ligeres spesifikt til 
polynukleotid overhengene. Til det overste polynukleotidet med overheng AGC ligereres det dermed en adapter med 
fragmentkombinasjonen AGC, osv. Deretter rettes DNA-molekylene ut ved hjelp av en vaeskestreftn, elektriskt felt 
eller lignende slik at de fluorescensmerkede adpterne kan avleses med en fluorescensscanner. Til slutt rekonstrueres 
sekvensen ved a aligne bitene med sekvensinformasjon. Legg foravrig merke til at den relative posisjonen til hver 
adapter varierer etter hvor polynukleotidet ble kuttet av Dnasel. Dermed kan hver bit med sekvensinformasjon gies 
en relativ posisjon pa polynukleotidet noe som gjor det lettere a rekonstruere sekvensen. 
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Fig. 2 . Prinsipp for a bygge opp lengre fragmentkjeder. DNA-moleky!et som skal sekvenseres, ACGTGAGCT, 
testes med den ene enden til en streptavidindekt plate. Festemekanismen b 0 r v*re en annen en streptavidin/b.otm. 
Deretter ligeres DNA-molekylet med et polynukleotid som inneholder et bindingssete for en typell restnksjons 
endonuklease med kuttesete utenfor bindingssete (F.eks. BspMI som vist her). Nir det i neste trmn kuttes med 
restriksjons endonukleasen dannes det et overheng med baser fra DNA-molekylet som skal sekvenseres. Deretter 
tilsettes det en tesning med ulike adaptere og ligase. Pa figuren ser man en adapter son. har Sienkjent og bundet seg 
til overhenget ACGT. I tillegg til fluorescensmerkede fragmenter som motsvarer overhenget ACGT er det 
innkorporert to eller flere biotinmolekyler pi adapteren. Nir DNA-molekylet rettes ut ved 1 hjelp av en vjeskestrem 
eller elektrisk felt er det denned mulig a feste fragmentene til underlaget slik som yist pi figuren. F™^J™™ *» • 
DNA-linkeren er a fa fragmentene festet et stykke unna det DNA-molekylet som skal sekvenseres. Denned blir det 
plass til en ny adapter i neste trinn) .Deretter kutter man med Smal og BspMI slik at DNA-linkeren fjernes samtidig 
som det dannes et nytt overheng bestiende av de fire neste baseparene pi DNA-molekylet. Denned kan man 
innligere en ny adapter med fluorescensmerkede fragmenter. Eneste forskjellen er at denne adapteren ikke inneholder 
en DNA-linker Dermed blir de fluorescenskmerkede adapteme festet til en ny posisjon pi streptavidinunderlaget 
Ved a bruke DNA-linkere med ulike lengder er det i prinsippet mulig i gjore svacrt mange slike 
konverteringssykluser etter hver andre. 
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Fig 3 Metode for parallel! sekvensering av gener ved hjelp av alternative 1) Genene som 0nskes sekvensert 
amplifiseres opp fra genomisk DNA ved hjelp av genspesifikke primere. 2) Det genereres overheng som er 
spesifikke for hvert gen for genene hybridiseres til oligonukleotider pa en DNA-chips. DNA-chipsen er laget slik at 
oligonukleotidene som er koraplementaere med genA overhengene befmner seg til venstre pa avlesningsplaten, mens 
de genB komplementasre befmner seg til hoy re. I virkeligheten er det mulig a lage flere tusen uhke adresser pa 
samme avlesningsplaten slik at det er mulig k sekvensere flere tusen gener parallelt. 

Alternativ2 

Utgangspunktet for prosedyren er at DNA-molekylene som skal sekvenseres kuttes opp i 
molekyler pa. noen fa kb eller lenger. Deretter innkorporerer man biotin i DNA-molekylene slik at 
det gjennomsnittlig er baser med biotin med f.eks. noen hundre basepars mellomrom (evt mer 
eller mindre avhengig av behov). DNA-molekylene festes deretter med den ene enden til en plate 
som er dekket med streptavidin. Festemekanismen for endene heft vaere en annen enn 
streptavidin/biotin. Molekylene rettes sa ut ved hjelp av en vaeskestrenm, elektrisk felt, eller annet. 
Til slutt forankres DNA-molekylene til underlaget ved a tilsette en reaksjonsksning som 
forarsaker biotm-streptavidin binding og behandles videre som beskrevet i figur 4. 
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Fis.4 Behandlingen av DNA-molekylet initieres med at den ene enden festes til underlaget (1). DNA-molekylet 
rettes deretter ut ved hjelp av en vaeskestrem, elektrisk felt eller lignende og forankres deretter til det 
SptavSekte undent ved hjelp av de innkorporerte biotinmolekylene (2). ^£^R£££^pe 
med Dnasel ellet lignende (3) &r man ligerer de Me endene med preadaptere som mneholder bindingsseter for type 
H restriksjons endohukleaser (ikke vist). Ved deretter a kutte med den respekt.ve endonukleasen dannes det overheng 
som ligeres med adapter* med sekvensinformasjon. TilACGT-overhenget ligeres ?«*^™£XZ^l a 
fragmentkombinasjonen ACGT, osv (4). I siste trinn bruker man en vaeskestram, elektrisk felt eller lignende til a 
rette utDNA-adapteme i en retning 90 grader pa retningen til DNA-molekylet som skal sekverjseres, for de 
forankres ved hjelp av biotin/streptavidin systemet. Siden alle DNA-molekylene er forankret til underlaget kan 
prosessen gjentaes til man far det onskede antallet basepar konvertert. Legg for 0vr,g merke t.l at de relaUve 
avstandene mellom adpteme tilsvarer de innbyrdes avstandene til sekvensb.tene har .DNA-molekylet som skal 
sekvenseres. Videre ma det nevnes at man selvfelgelig kan sekvensere svasrt mange DNA-molekyler parallelt pa en 
avlesningsplate. 
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1. 

Fremgangsm&te for sekvensanalyse, karakterisert ved 
beskrivelsen. 




Sammendrag O. nr. El 0508 

Metode for konvertering og avlesning til bruk ved sekvensanalyse. 



